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一 代 互 联网 CNGI (China next generation Internet ) 与 
机 构 也 早已 对 IPv6 进行 了 预先 部 署 吊 。IPv6 地 址 长 度 从 IPv4 ”节点 ， 大 大 增加 了 访 存 次 数 。Dharmapurikar 等 人 提出 了 


一 种 B- 树 和 Bloomifilter 相 结合 的 IPv6 路 由 查找 算法 
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摘 要 : 为 了 提高 IPv6 的 路 由 查找 效率 ， 针 对 IPV6 路 由 前 绥 分 布 不 均匀 的 问题 ， 提 出 了 一 种 基于 B- 树 和 Bloom filter 
相 结合 的 IPV6 路 由 查找 算法 (BTBF)。BTBF 分 为 B- 树 和 Bloom filter 查找 两 部 分 ， 首 先 利 用 B- 树 查找 路 由 前 缀 的 前 
16bit 值 ， 然 后 通过 B- 树 节点 中 位 向 量 的 映射 ， 将 下 一 步 链 接 到 Bloom filter， 再 利用 Bloom filter 位 数组 的 值 映 射 提取 
下 一 跳 。 实 验 结果 表明 ，BTBF 算法 与 其 他 树 形 和 Bloom filter 类 算法 相 比 有 效 减 少 了 空间 和 时 间 占 用 ， 在 路 由 表 项 数 
变化 较 大 的 情况 下 也 能 维持 稳定 的 查找 性 能 。 
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Fast IPv6 routing lookup combining B-tree and Bloom filter 


Yao Mingl, Zhao Jing Jingl, He Xing Yal, Yang Yunl 
(1. Information Engineering College of YangZhou University, Yangzhou 225002, China) 


Abstract: In order to improve the efficiency of IPv6 routing lookup, this paper put forward an IPv6 routing lookup algorithm 
(BTBF) based on the combination of B-Tree and Bloom filter for the uneven distribution of IPv6 routing prefix. BTBF includes 
two parts, namely, B-Tree and Bloom Filter lookup: firstly, this paper looked up the first 16bit value of routing prefix with B- 
tree, and linked the next step to Bloom filter through the mapping of middle bit vector of B-tree node; then, extracted the Next 
hop through the value mapping of Bloom filter bit array. The experimental results show that, compared with other Tree and 
Bloom filter algorithms, BTBF algorithm can effectively reduce space and time, and maintain stable routing performance under 
the condition of larger changes in Routing-Table Entries. 
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RBMRTs 的 内 部 节点 中 存储 了 许多 重复 点 ， 路 由 更 新 时 增加 了 


时 间 和 内 存 需求 。BSRPS 算法 器 将 相 邻 的 前 缀 1 


II 


区 间作 为 一 个 


JIPv6 得 到 了 产业 界 和 学 术 界 的 广泛 关注 和 认可 ， 中 国 的 下 集合 放置 在 一 个 节点 中 以 减少 查找 树 产 生 多 余 的 空置 与 重复 节 


A 


国联 邦 点 ,但 是 该 算法 面 对 卫 v6 的 海量 地 址 空间 时 依然 产生 很 多 


的 32bit 变 为 128bit, 使 得 互联 网 的 骨干 网 路 由 器 在 进行 表 项 查 Bloomtfilter 的 最 长 前 级 匹配 算法 [9, 该 算法 将 不 同 长 度 的 人 地 
找 时 遇 到 巨大 的 性 能 瓶颈 。 因 此 ,必须 研究 针对 IPv6 路 由 表 的 。” 址 前 级 , 分 别 存 储 在 不 同 的 Bloom filter 中 ， 在 进行 查找 时 ， 将 
可 靠 快速 的 查找 机 制 外 B31。 待 查找 人 P 地 址 并 行 输入 到 各 个 过 滤器 中 进行 查询 。 该 算法 容易 

卫 路 由 查找 算法 可 分 为 基于 前 组 长 度 和 基于 前 绥 值 的 查找 。 产生 过 多 的 误 判 ， 而 且 路 由 表 中 不 同 前 缀 长 度 对 应 的 路 由 表 的 
算法 。 基 于 前 级 长 度 的 算法 多 采用 树 形 数据 结构 ， 不 过 在 推 / 规模 大 小 差异 很 大 ,无 法 保证 找到 一 个 适应 力 强 的 Bloom filter。 
至 IPv6 查找 时 ， 卫 地 址 长 度 增长 至 IPv4 的 4 倍 ， 树 形 结构 的 ”基于 TCAM 的 高 效 浮动 关键 词 匹配 算法 四 中 采取 前 缀 扩展 的 方 
查找 深度 变 大 从 而 降低 了 查找 效率 。 基 于 前 级 值 的 查找 算法 可  ” 式 减 少 了 Bloom filter 的 数量 , 但 是 同时 也 扩大 了 路 由 表 ， 降低 
以 避免 查找 树 的 较 大 深度 的 问题 ，Zhong 中 提出 了 一 种 以 B- 树 了 查找 速度 。 基于 Bloom 滤波 器 的 快速 路 由 查找 方法 外 主要 在 
为 基础 的 递归 平衡 多 路 径 区 间 树 (RBMRTs) 的 数据 结构 进行 ”索引 表 中 探测 首 字 节 以 减少 Bloom filter 查询 次 数 , 但 是 未 对 首 
最 长 前 级 匹配 , 查找 和 更 新 的 时 间 复 杂 度 均 为 O(logmN)。 但是， ” 字 节 长 度 做 出 规定 ， 因 此 首 字 节 过 滤 效 率 不 明确 ， 而 且 在 了 Pv6 
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空间 基础 上 索引 表 会 增加 查找 时 间 。 

针对 以 上 问题 , 在 当前 骨干 路 由 器 IPv6 路 由 表 数 据 统计 分 
析 的 基础 上 ， 结 合 B- 树 和 Bloom filter， 提 出 了 一 种 IPv6 路 
查找 算法 。 因 为 B- 树 在 查询 数量 较 多 的 路 由 表 项 时 会 出 现 大 量 
重复 节点 的 现象 ， 所 以 仅 用 B- 树 查找 前 16bit 前 绥 值 ， 并 形成 
对 Bloom filter 的 索引 ， 步 的 查找 。B- 树 


未 
3 
区 


表 进 行进 


深度 小 ， 能 有 效 避 免 空 :置信 合 ， 在 B- 树 的 索引 下 ， 降 低 Bloom 
filter 需要 查找 的 路 由 表 项 规模 、 误 判 率 和 查找 时 间 。 


1 “IPv6 地 址 结构 和 骨干 路 由 表 特 点 


1.1 1IPv6 地 址 结构 

RFC3587 规定 的 最 新 IPv6 全 球 单 播 地 址 结构 如 图 1 所 示 ， 
3 个 部 分 组 成 : nbit 的 全 球 路 由 前 缀 、64-nbit 的 子 网 标志 和 
64 bit 的 接口 标志 。 全 球 路 由 前 级 标志 一 个 站 点 , 子 网 标志 用 于 
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得 到 图 3， 图 中 一 
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条 线 代 表 了 一 个 前 16 bit 取 值 的 集合 、 在 不 


同 前 缀 长 度 的 路 


表 前 级 集合 数目 变化 。 


路 由 表 来 自 : http/bgp.potaroo.net/v6/as2.0/bgptable.txt 


虽然 前 16bit 前 绥 
是 从 图 3 中 可 以 看 出 ， 


标志 站 点 内 的 一 个 子 网 ， 接 口 标志 是 用 IEEE EUI-64 格式 生成 


图 3 potaroo 路 由 
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前 绥 长 度 


表 项 前 16bits 取 值 及 长 度 统计 
值 形成 的 各 集合 元 素 个 数 差 异 较 大 ， 但 


其 分 布 的 特征 基本 相同 。 利 用 B- 树 和 前 


缀 长 度 值 ,把 整个 路 由 表 项 划分 成 很 多 个 元 素 个 数 较 少 的 集合 ， 


Te ”的 用 来 表示 子 网 内 的 主机 ,用 于 路 由 的 前 级 长 度 最 长 为 64 bit。 图 中 每 一 个 峰值 对 应 一 个 划分 好 的 集合 ， 代 表 Bloom Filter 需 
> 根据 对 肯 干 路 器 的 统计 分 析 得 知 IPv6 前 绷 长 度 最 小 为 19 bit。 要 查找 的 路 由 表 项 。 为 了 简化 算法 设计 ， 对 所 有 集合 的 数目 设 
< 十 二 : ee | a | 定 一 个 闵 值 用 来 划分 级 别 ， 图 3 中 的 虚线 位 置 1000 将 这 些 集 
< 十 合 划分 了 千 级 和 百 级 。 这 样 Bloom Filter 可 以 针对 划分 好 的 级 
2 全 球 路 由 前 级 子 网 人 D 撤 别 , 得 到 最 优 的 Hash 函数 个 数 和 位 数组 大 小 , 以 便 在 降低 错误 
LO 率 的 同时 提升 查找 效率 。 
© 辐 1 IPv6 全 球 单 播 地 址 结构 
GD 1.2 骨干 路 由 表 特 点 2 基于 B- 树 和 Bloom filter 的 路 由 查找 算法 
已 夺目 王 路 由 融 potaroo" 日 治 域 AS131072 的 甩 有 名 万 作 委 IPv6 路 由 表 中 前 16 bit 取 值 较 少 ， 在 2001、2600 和 2804 
A 路 由 表 项 的 统计 分 析 , 可 以 发 现 目前 骨干 路 由 器 中 IPv6 地 址 有 上 较为 集中 ， 其 余 的 取 值 路 由 表 项 较 少 。BTBF 首先 利用 B- 树 
.之 如 TF 特 点 ; 对 前 16bit 的 取 值 进行 查询 ， 将 每 个 对 应 的 路 由 表 依据 前 弘 长 

a) 如 图 2 所 示 ， 对 前 16 bit 取 值 统计 发 现 ， 无 前 绥 长 度 小 度 进行 分 类 ,如 potaroo 骨干 路 由 器 可 以 从 /19-/64 共 分 为 46 个 
E 于 16bit 的 路 由 表 项 ， 前 16 bit 取 值 有 39 个 ， 其 分 布 不 均匀 且 。 组 。 每 组 对 应 一 个 Bloom filter， 对 不 同 规模 的 组 ， 采 取 不 同 数 
.一 数目 差别 较 大 。 基 于 前 绥 值 的 查找 方法 不 能 有 效 匹 配 到 数量 较 量 的 hash 函数 和 位 数组 大 小 ， 降 低 无 效 探测 的 次 数 。 
多 的 前 级 集合 中 , 在 针对 IPv6 进行 路 由 查找 时 ， 一 方面 需要 增 2.1 数据 结构 

加 路 由 查找 取 值 较 多 集合 的 概率 ， 另 一 方面 需要 减少 路 由 前 绥 


值 查 找 树 的 深度 , 以 便 更 快 的 找到 所 需要 探测 的 集合 , BTBF 算 
法 中 采用 B- 树 以 实现 更 低 的 查找 树 深度 。 


路 由 表 来 自 : http://bgp.potaroo.net/v6/as2.0/bgptable.txt 
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“Ll, ha, 


器 所 有 前 16bits 取 值 统计 
b) potaroo 官网 数据 显示 ，IPv6 路 由 表 由 前 绥 长 度 值 从 /16 
到 /64 的 分 布 差异 很 大 , 对 AS131072 路 由 表 进 一 步 统计 分 析 后 


路 由 表 项 集合 数目 /个 


图 2 potaroo 路 由 


2.1.1 前 16 bit 值 的 B-tree 树 型 结构 


B-tree 的 查找 、 捐 


入 和 删除 操作 皆 以 “对 数 时 间 ” 的 速度 完 


成 ， 它 是 一 种 自 平衡 的 树 ， 所 以 B 树 不 需要 像 其 他 平衡 查找 树 


定 的 实现 而 设置 ， 


子 节 点 ; 


那样 频繁 地 重新 保持 平衡 。 子 节点 数量 的 上 界 和 下 界 ， 根 据 特 
根据 前 16 bit 取 值 出 现 的 数量 较 少 ， 
布 不 均匀 的 特征 , 设 定 B 树 子 节点 数量 的 上 界 为 2, 下 界 为 3， 

通常 这 种 树 也 被 称 之 为 2-3 树 。 该 树 有 三 个 重要 特征 : 非 空 节点 
上 的 “数据 项 ”大 于 等 于 1 且 小 于 等 于 2; 
该 树 是 自 平衡 树 。 在 进行 更 


数值 分 


3 厅 


每 个 节点 最 多 有 
新 时 需要 将 4-node 转换 为 


3-node 或 2-node， 这 个 转换 操作 只 需要 在 常数 量 级 的 时 间 内 即 


可 实现 。 


2.1.2 B-tree 节点 的 数据 结构 
B-tree 的 节点 类 型 分 为 叶子 节点 和 非 叶 子 节点 ， 
上 存储 有 1-2 个 数据 项 ， 这 些 数据 项 存储 了 前 16 位 前 级 值 。 


点 与 Bloom filter 的 转发 操作 利用 型 
Vs[h(/19), h(/20), (21),..., 


入 


两 个 长 m bit 的 位 向 量 : 
hn(/64)] 和 Vi[h(19), A(20), (21),..., 
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h(/64)]。Vs 和 矿 分 别 存储 了 集合 元 素 的 映射 信息 ， 向 量 内 的 。 素 之 后 , 再 来 查询 w 是 否 在 集合 之 中 , 而 如 果 w 经 过 三 个 hash 
Hash 函数 h(/n) 会 根据 前 缀 长 度 二 将 集合 映射 到 向 量 玉 中 ， 其 函数 计算 得 出 的 结果 所 得 索引 处 的 比特 位 全 是 1， 那 么 Bloom 
中 树 节点 的 数据 结构 如 图 4 所 示 。 filter 则 得 出 w 在 集合 之 中 , 实际 上 这 里 是 误 报 , w 并 不 在 集合 
之 中 。 标准 Bloom filter 不 能 进行 删除 操作 ， 改 用 counters 计数 
数组 改进 原 有 的 位 数组 。 在 插入 元 素 时 给 计数 数组 的 上 个 元 素 
的 值 分 别 加 1， 删除 元 素 时 给 计数 数组 个 元 素 的 值 分 别 减 1。 

Bloom filter 用 来 探测 B- 树 的 匹配 节点 转发 到 的 路 由 表 项 
， 有 具体 方案 是 : 首先 ， 读 取 VIh(/19), h(/20), 有 (1/21),.….,h(/m)] 
图 4 B-tree 节点 数据 结构 向 量 各 个 非 空 元 素 值 , 得 到 m 个 集合 的 地 址 (1<m<n-18) ,每 一 

该 节点 含有 两 个 数据 项 $ 和 工 ， 标 志 位 CNUMBER， 三 个 ”个 集合 都 对 应 了 一 个 Bloom filter, 所 以 共有 m 个 Bloom filter。 
指针 LNode，MNode 和 RMode， 及 两 个 向 量 六 和 琅 。8$ 和 工分 ” 然后， 将 数据 包 的 目的 IP 地 址 并 行 输入 到 这 m 个 Bloom filter 
别 为 节点 中 较 小 的 前 级 值 和 较 大 的 前 缀 值 ,各 16 位 -CNUMBER ”中 查询 。 最 后 ， 根 据 匹配 到 的 Bloom Filter 计数 数组 的 取 值 索 
为 该 节点 的 子 节点 数量 ， 标 记 节 点 类 型 为 2-node、3-node 或 叶 ”引路 由 表 ， 提 取 下 一 跳 地 址 。 
子 节点 ， 共 有 2 位 ， 取 值 可 为 11、10 或 00。 如 果 CNUMBER 


S 也 CNUMBER 


LNode MNode RNode 


Vs[h(19),1(/20),h(/21), “1(/64)] 


Vi[1(19),h(/20),021), *…,h(/64)] 


为 11 该 节 点 则 为 3-node, 并 表示 节点 最 多 有 3 个 子 节点 , 节点 1 

中 存储 全 部 的 数据 项 、 子 节点 指针 和 向 量 ， 如 果 CNUMBER 为 加 | 

10 该 节点 则 为 2-node， 并 表示 节点 最 多 拥有 两 个 子 节点 , 数据 0 和 

项 仅 保留 5S， 向 量 仅 保留 Vs; 如 果 CNUMBER 的 值 为 00 时 表 了 

示 当 前 节点 无 子 节点 即 为 叶子 节点 。LNode，MNode 和 RNode 和 oe 人 [) fc) 

分 别 为 节点 的 左 中 右 子 节点 指针 。Vs 和 态 为 节点 中 的 两 个 向 a ol 

量 ， 映 射 路 由 前 缀 前 16bit 的 值 为 8 或 的 路 由 表 项 集合 ， 该 | 要 

向 量 的 每 个 元 素 为 hash 值 h(/n)，h0) 为 hash 函数 ，n 为 前 绥 长 NE I 

度 。h(/n) 表 示 前 红 长 度 为 n 的 路 由 表 项 集合 地 址 。 根 据 目 前 1 

IANA 的 IPv6 地 址 分 配 策略 , 骨干 路 由 器 中 无 前 级 长 度 小 于 19 

的 路 由 表 项 ,因此 向 量 的 元 素 从 h(/19) 至 h(/64) 有 序 存储 。 路 到 6 路 由 前 级 集合 存储 与 地 址 映射 

查找 两 个 阶段 的 转发 操作 利用 到 了 六 和 WV， 当 B- 树 节点 匹配 在 最 后 一 个 步 又 中 , Bloom filter 仅 能 探测 有 无 符合 目标 卫 

成 功 时 ， 算 法 选取 数据 项 8 或 者 工 对 应 的 向 量 ， 读 取向 量 元 素 ”地 址 的 最 长 前 绥 ， 它 的 本 身 是 不 存储 路 由 表 的 ， 具 体 的 下 一 跳 

存储 的 路 由 集合 地 址 ， 转 发 至 Bloom filter 查询 。 由 址 需要 进一步 地 搜索 路 由 表 。 即 使 骨干 路 由 表 按 照 前 绷 长 度 

2.1.3 Bloom filter 的 数据 结构 进行 了 分 类 ， 但 是 某 些 长 度 的 集合 表 项 依然 十 分 庞大 ， 传 统 的 
如 图 5 所 示 ， 首先，Bloom filter 初始 化 后 有 一 个 m 位 的 位 搜索 提取 会 对 查找 性 能 造成 影响 ， 所 以 提出 Bloom Filter 的 映 


数组 ， 数 组 元 素 全 为 0。 同时， 定义 了 个 不 同 的 Hash 函数 ， 射 方 式 对 目标 路 由 表 项 进行 快速 提取 。Bloom Filter 中 插入 一 个 


每 一 个 hash 函数 都 随机 的 将 输入 元 素 映射 到 位 数组 中 的 一 个 ” 新 的 前 级 六 时 ， 得 到 counters 位 数组 的 值 C,。 如 图 5，X 的 值 
位 上 。 那 么 在 没有 发 生 误 判 的 情况 下 ， 对 于 一 个 确定 的 输入 ， Cx=0100010000 01000 = 0x2208。 通 过 GC; 的 值 建立 地 址 映射 大 


都 会 得 到 一 个 确定 的 位 数组 值 。 (Cn), 此 地 址 映射 就 是 目标 下 地 址 前 级 在 路 由 表 中 的 具体 位置 。 
通过 这 种 方法 可 以 对 人 P 数据 包 进 行 快速 查找 并 转发 ,图 6 给 出 
了 路 由 表 项 的 存储 及 各 表 项 地 址 的 关系 示意 
6 2.2 ”路 由 查找 
路 由 查找 的 伪 代 码 如 下 所 示 : 
input:dstIP; /目的 下 地址 
output:next hop; 
Search BTBF(dstIP){ 
BMP = next hop of default route; 
key = the 1-16bit of dstIP; 


砚 


Counters| 0 | 1 ofofo of :lo 
图 5 基本 Bloom filter 与 改进 后 的 Bloom filter 

在 标准 Bloom filter 算法 中 常常 会 碰 到 哈 希 算法 中 的 冲突 
(碰撞 〉 问题 ， 不 同 数值 经 过 哈 希 得 到 的 两 个 结果 值 有 可 能 相 
同 ， 这 时 就 会 发 生 误 判 00。 图 5 中 ， 当 插入 x、y、z 这 三 个 元 


node = search B-Tree of order 3(key); 
if(node.CNUMBER == 2) node.S = node.L; 
if(key !=node.S || key != node.L){ 


SN 
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这 key < node.S ) node = node.LNode; 据 项 比较 ， 在 key 与 数据 项 都 不 相等 的 情况 下 ， 根 据 条 件 式 决 
这 key > node.S && key < node.L) node = node.MNode; 定 转发 至 LNode，MNode 或 RNode 查找 。(6-10 行 )。 如 果 无 匹 


. 这 key >node.L) node = node.RNode; 配 到 的 节点 并 且 当 前 节点 为 叶子 节点 ， 说 明 路 由 表 项 中 不 存在 
10. search BTBF(dstIP); 匹配 的 前 级 ,转发 数据 包 至 默认 下 一 跳 。( 第 12 行 )。 如 果 有 匹 
11. }elsef 配 的 节点 ， 则 返回 节点 中 对 应 的 向 量 (13-14 行 )。 最 后 在 
12. ifnode.CNUMBER == 0) return BMP: Bloom Filter 中 查找 目的 人 地 址 对 应 前 级 长 度 前 级 ,如果 找到 ， 
13. if(key = node.S return Vs[]; 则 返回 counters 数组 值 ， 并 根据 这 个 值 对 地 址 进行 提取 ; 如 果 
14. if(key = node.L return V1i[]; 没有 找到 ， 则 转发 至 默认 路 由 下 一 跳 (16-20 行 )。 

15. } 图 7 为 算法 流程 图 ， 算 法 采用 B- 树 和 Bloom Filter 相 结 合 的 方 
16. i= the length of route prefix; 式 进行 路 由 查找 ， 因 此 图 7 共 分 为 2 大 部 分 ， 左边 部 分 为 B- 树 
17. counters = BinaryArray of Bloom Filter; 查找 过 程 ， 右 边 部 分 为 Bloom Filter 查找 过 程 。B- 树 部 分 查找 
18. for (i= 64 down to 19)search dstIP%i; 过 程 如 下 : 

19. if (V[h(/)] = 1) return counters[i]; a) 截取 当前 需要 查询 的 耳 地址 的 前 16bit， 并 将 它 的 值 赋予 变 
20. return BMP = fx(counters[i]) -> nexthop;} 量 key， 将 节点 变量 node 赋值 为 B- 树 根 节点 ; 


先 将 路 由 器 的 默认 下 一 跳 存 入 BMP (Best Matching Prefix ) b) 第 二 步 进 入 B- 树 的 遍历 查找 ， 
(第 2 行 ), 然后 提取 目的 IP 地 址 的 前 16bit 在 B- 树 上 查找 (3- 中 的 5 相等 ， 若 等 ， 则 匹配 成 功 ， 进 入 Bloom Filter 查询 玲 向 
14 行 )， 有 具体 查找 过 程 如 下 ， 首 先 判 断 当 前 节点 类 型 是 2-node 量 映射 的 路 由 表 集 合 。 若 不 等 ， 则 判断 是 否 和 节点 node 中 的 工 


判断 key 是 否 和 节点 node 


NS 


中 


还 是 3-node 类 型 ， 如 果 节 点 类 型 是 2-node， 则 数据 项 8 赋值 为 相等 ， 若 等 ， 则 进入 Bloom Filter 查询 万 向 量 映射 的 路 集 
工 〈 第 5 行 )。 然 后 赋值 目的 卫 地址 的 前 16 位 值 为 key 并 与 数 合 ; 


Key= 前 16bit 值 
赋值 当前 查询 节 | 
点 为 B 树 根 节 点 node=rootNode 


无 匹配 对 象 


Bloom Filter 


默认 下 一 跳 


/19/20/21 /22 63 /64 


目的 人 P 地 址 映射 


node=LNode node=RNode = 


按 位 再 次 划分 集合 


Vi 向 量 映射 的 路 由 表 项 集合 Vs 向 量 映射 的 路 由 表 项 集合 


一 


图 7 路 由 查找 流程 区 
c) 如 果 key 和 与 都 无 法 匹配 ,那么 需要 进入 下 一 节点 了 予 node 变量 ， 进 入 第 b) 步 循环 查找 。 

查询 。 首 先 根据 CYUMBER 取 值 判断 node 节点 有 几 个 孩子 节 当 目 的 地 址 IP 的 前 16 bit 在 B- 树 查找 匹配 成 功 后， 将 得 

点 ， 若 CNUMBER 为 00， 则 表示 其 为 叶子 节点 ， 此 时 匹配 项 为 ”到 其 值 对 应 的 向 量 严 所 映射 的 路 由 表 项 集合 ， 在 该 集 


合 里 ， 按 
默认 下 一 跳 ， 若 CNUMBER 为 01， 则 表示 该 节点 有 两 个 子 节  ” 照 前 绥 长 度 /19-/64 再 次 划分 为 46 个 小 集合 ， 每 个 集合 对 应 一 
点 ， 当 key 值 大 于 S 时 进入 左 节点 LNode 查询 ， 小 于 S 时 ，3 个 Bloom filter， 然 后 进入 Bloom filter 查询 阶段 : 
入 右 节点 RNode 查询 ; 若 CNUMBER 为 11， 则 表示 该 节点 有 a) 将 目的 人 P 地 址 按 位 从 /19 至 /64 并 行 输入 到 对 应 长 度 的 
三 个 子 节点 ， 当 jey 小 于 5 时 进入 左 节点 ZNode 查询 ，key 大 ”Bloom Filter 中 进行 查找 ; 
于 S$ 且 小 于 工时 进入 中 节点 MNode 查询 , key 大 于 工时 进入 厂 b) 如 果 Bloom filter 验证 没有 匹配 项 , 则 进入 默认 下 一 跳 。 


节点 LNode 查询 。 最 后 将 查找 到 的 LNode, RNode 或 MNode 赋 如 果 Bloom filter 验证 有 匹配 项 ， 则 根据 Bloom Filter 中 的 前 绥 
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地 址 映射 得 到 对 应 的 下 一 跳 。 至 此 ， 查 找 流程 结束 。 
2.3 ”路 由 更 新 及 算法 性 能 分 析 
2.3.1 路 由 的 更 新 过 程 

BTBF 算法 支持 增 量 更 新 ， 在 路 由 表 发 生变 化 时 只 需要 局 
部 更 新 数据 结构 而 不 需要 重头 重新 构建 整个 数据 结构 。 当 
添加 一 个 新 的 路 二， 需要 分 别 执行 B- 树 的 插入 操作 并 在 
Bloom Filter 中 执行 计数 数组 元 素 值 增 加 操作 。 
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姚 ” 明 ， 等 : 一 种 B- 树 和 Bloomfilter 相 结合 的 IPv6 路 由 查找 算法 
mm mL 
k=—iIn2 0.7— 
a n 
最 优 的 位 数组 大 小 m 由 以 下 公式 确定 : 
_ ninp 
(In2)? 


根据 以 上 公式 ， 可 以 确定 出 Bloom Filter 最 优 的 位 数组 大 
小 和 Hash 函数 个 数 , 从 而 大 大 降低 它 的 错误 率 , 假设 将 错误 率 


a) B- 树 中 的 插入 操作 为 :获取 路 由 项 的 前 16bits 前 绥 值 
value 和 前 级 长 度 n， 在 B- 树 查找 value 并 得 到 匹配 节点 ， 如 果 
匹配 节点 的 $ 或 者 工 值 有 相同 数值 ， 则 转发 向 量 VIh(/n)] 元 素 
索引 的 Bloom Filter 进入 第 b) 步 更 新 ， 如 无 此 值 ， 则 在 B- 树 
节点 中 插入 该 值 ，B- 树 (本 章 算 法 使 用 的 是 2-3 树 ) 会 根据 需 
要 自动 旋转 以 致 平衡 , 最 后 ,更 新 向 量 元 素 VIh(/n)]， 并 转发 至 
h(n) 映 射 的 Bloom Filter 进入 第 (2) 步 更 新 。 

b) Bloom filter 的 插入 操作 为 : 第 a) 步 映射 的 Bloom Filter 
的 counters 计数 数组 探测 到 的 元 素 值 +1。 

删除 前 缀 信息 的 操作 与 更 新 操作 类 似 ， 首 先 执行 更 新 过 程 
的 第 a) 步 的 B- 树 查找 操作 , 不过, 第 b) 步 counters 计数 数组 
元 素 的 值 -1。 此 外 ， 当 Bloom Filter 的 counters 数组 值 CG 为 0 
时 ,表示 该 集合 已 无 路 由 前 级 ， 这 时 需要 回 济 至 B- 树 节点 ， 向 
量 元 素 VIh(n)] 置 0， 并 释放 地 址 映射 。 若 向 量 玉 所 有 元 素 值 均 
为 0， 则 需要 回溯 至 B- 树 ， 删 除 节 点 中 相应 数据 项 ， 最 后 执行 
自动 平衡 旋转 操作 。 

2.3.2 算法 性 能 分 析 

B- 树 的 高 度 决 定 了 查找 效率 ，BTBF 算法 采用 的 2-3 树 形 
结构 ， 在 最 坏 的 情况 下 ， 也 就 是 所 有 的 节点 都 是 2-node 节点 ， 
查找 效率 为 lg N。 最 好 的 情况 所 有 的 节点 都 是 3-node 节点 ， 查 
找 效率 为 log 3N 约 等 于 0.631lgN 距离 来 说 ， 对 于 1 百 万 个 节 
点 的 2-3 树 ， 树 的 高 度 为 12-20 之 间 ， 对 于 10 亿 个 节点 的 2-3 


控制 在 0.001 左右 ， 根 据 前 文 骨干 路 由 器 的 数据 统计 可 知 ， 在 
数据 最 庞大 的 2001:: 段 ， 前 缀 长 度 集合 根据 数量 可 分 为 千 级 和 
百 级 , 如 /48 长 度 的 为 2970 个 , 2620:: 段 /32 长 度 的 为 1362 个 ， 

为 了 方便 分 级 定位 和 干 级 的 集合 统一 取 n 值 为 2500, 根据 计算 结 
果 可 知 即使 是 大 的 集合 ， 最 优 的 位 数组 大 小 也 仅 为 mw35Kb， 

最 优 Hash 函数 的 个 数 磊 为 10.06， 所 以 入 10。 与 上 述 同 理 ， 百 
级 集合 取 近 似 中 位 数 200, 它 的 最 优 位 数组 大 小 和 Hash 函数 个 
数 分 别 为 2.8Kb 和 10 个 。 相 比 SARANG DI[6] 和 J. H. Mun[10] 
提出 的 Bloom Filter 类 路 由 查找 算法 ， 本 文 在 两 次 划分 集合 后 

使 集合 元 素 个 数 和 Hash 函数 的 数量 都 得 到 大 幅度 缩减 。 同 类 
型 的 Bloom Filter 需要 查找 整个 路 由 表 项 ，Hash 函数 个 数 在 13 
个 以 上 ， 不 仅 增加 了 误 报 率 ， 还 增加 了 查找 时 间 ， 降 低 查 找 效 


Le 


3 ”实验 验证 


实验 阶段 收集 了 IPv6 骨干 路 由 器 自治 域 AS6447、 
AS131072 和 AS3356 的 路 由 前 缀 , 使 用 C++ 语言 在 Visual Studio 
平台 上 编写 了 测试 代码 。 首 先 统计 了 三 个 自治 域 的 路 由 表 项 ， 
根据 统计 结果 和 上 文中 Bloom Filter 最 优 数 组 大 小 m 和 Hash 函 
数 个 数值 的 公式 ,将 经 过 B 树 分 类 后 的 路 由 表 项 集合 进行 了 
分 类 处 理 。 分 类 结果 与 上 文 相同 , 确定 了 两 个 级 别 : 千 和 百 级 ， 
m 和 大 分 别 为 3SKb、10 和 2.8Kb、10。 对 应 的 错误 率 为 0.001。 


树 ， 树 的 高 度 为 18-30 之 间 。 插 入 只 需要 修改 与 该 节点 关联 的 
节点 即 可 ， 不 需要 检查 其 他 节点 ， 所 以 效率 与 查找 相同 。 

本 文 算 法 中 B- 树 仅 负责 查找 前 16bit 前 级 值 ， 而 当前 骨干 
路 由 表 的 前 16bit 值 只 有 几 十 个 , 可 以 形成 较 好 的 树 形 , 因此 时 
间 复 杂 度 约 为 O(log3N)， 而 仅 使 用 B- 树 进行 路 由 查找 的 
RBMRTs 算法 查找 效率 为 O(logN)。 本 文 算法 每 个 节点 至 少 可 
存储 两 个 路 由 匹配 项 ， 最 好 情况 下 需要 N/3-N/2 个 节点 ， 
RBMRTs 算法 则 至 少 需要 2N 个 节点 。 

Bloom Filter 的 插入 /查询 时 间 都 是 常数 O( 有 ),，k 为 Hash 函 
数 个 数 ， 使 用 Bloom Filter 需要 考虑 到 它 的 错误 率 《〈 误 判 率 )， 
错误 率 由 以 下 公式 确定 : 


lnm\ a 

p=(1-(1- 忆 ) ~ (1-e*) 

m 是 位 数组 大 小 , n 是 Bloom Filter 查找 的 集合 元 素 个 数 。 上 述 

公式 表明 随 着 m 的 增加 ， 错 误 率 会 下 降 ， 同 时 随 着 插入 元 素 个 

数 的 增加 ， 错 误 率 又 会 上 升 ， 对 于 给 定 的 错误 率 p， 最 优 
Hash 函数 个 数 丰 由 以 下 公式 确定 : 


天 


实验 中 为 了 符合 实际 情况 ， 均 使 用 各 自治 域 的 活跃 路 由 项 。 
表 1 三 个 自治 域 中 前 绥 统 计 


路 由 表 项 数 AS6447 AS3356 AS13172 
前 16bit 为 2001 2899 3619 5440 
前 16bit 为 2600 1167 1609 2287 
路 由 表 项 总 数 48348 56444 85899 
在 实现 Bloom Filter 时 多 采用 简单 、 性 能 较 优 的 折 锥 异 或 


哈 希 函数 。 生 成 了 10 万 个 数据 包 进 行 测试 , 为 了 验证 数据 包 的 
大 部 分 都 有 匹配 条 目 ，85% 的 数据 包 是 从 路 由 表 中 选择 的 路 | 
条 目 ， 另 外 15% 的 验证 包 是 完全 随机 生成 的 ， 这 样 验证 包 可 以 
匹配 到 路 由 条 目 ， 也 可 以 匹配 到 默认 下 一 跳 。 为 了 
Filter 的 错误 率 稳 定性 ， 分 别 对 以 上 三 个 自治 域 的 2001:: 段 和 
2600:: 段 做 了 Bloom Filter 错误 次 数 的 统计 。 统 计 结 果 如 图 8 所 
示 。 从 图 8 可 以 看 出 实验 结果 基本 与 算法 设计 相符 ， 错 误 率 保 
持 在 0.001 左右 。 在 实际 应 用 中 ， 还 可 以 根据 每 一 个 集合 的 大 
小 定制 最 优 的 Bloom Filter， 从 而 使 错误 率 更 加 符合 


验证 Bloom 


们 全 预 设 。 
算法 内 存 消耗 主要 用 于 B- 树 、Bloom Filter 的 位 数组 和 路 
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表 项 的 加 载 。 在 内 存 消耗 的 实验 中 ， 使 用 AS131072 的 BGP 
路 由 表 ，BTBF 算法 的 实现 占用 内 存 保持 在 2700 KB， 其 中 绝 
大 多 数 用 于 对 路 由 表 的 加 载 。 表 2 给 出 了 内 存 消耗 比较 的 结果 。 
布 隆 过 滤器 错误 统计 
140 
8 
120 
12 
,100 Q1 
如 80 上 9 
屋 60 
者 
40 
20 上 
0 
和 2 3 4 § 6 
表 2 中 的 集合 
图 8 Bloom Filter 错误 次 数 统计 
表 2 真实 路 由 表 测 试 内 存 占用 比较 结果 
查找 算法 表 项 数 内 存 
本 文 算法 85899 3.16M 
基于 Hash 和 CAM 的 IPv6 路 由 算法 65535 15.33M 
基于 Bloom 滤波 器 的 快速 路 由 查找 25000 4M 
BSRPS 78430 4.8M 


[nn 


的 实验 ， 继 续 
RBMRTs 算法 ， 


的 端点 ， 当 路 


表 项 增 大 时 ， 


不 能 输出 稳定 


的 性 能 。 


E 论 上 BTBF 算法 时 间 复 杂 度 最 多 为 0(5)。 查 找 性 能 部 分 
使 用 上 文中 的 10 万 个 数据 包 进 行 测试 ， 并 与 
BSRPS 算法 和 Bloom 滤 ; 
行 了 比较 。RBMRTs 算法 的 查找 树 内 部 节点 中 存储 了 许多 重 


皮 器 路 由 查找 算法 进 


重复 的 端点 也 会 成 倍增 加 ， 导 致 


BSRPS 算法 是 根据 前 级 值 区 间 所 做 的 集合 树 进行 查找 , 其 


性 能 表现 稳定 


， 但 是 


不 能 控制 到 一 个 较 低 的 级 别 ， 


基于 Bloom 滤波 器 的 算法 采用 


一 部 分 不 在 路 


的 探测 次 数 ， 不 过 ， 当 被 查询 地 址 的 首 
多 时 ， 首 字 节 索引 方式 较 并 行 查询 的 
的 减少 导致 错误 率 和 查找 时 间 ] 


表 中 匹配 的 


与 BTBF 算法 在 同一 ] 


于 IPV6 的 海量 


bh 址 空间 , 集合 树 的 深度 
所 以 性 能 并 不 是 十 分 良好 。 

了 首 字 节 索引 的 方式 排除 了 
IP 地 址 ， 降 低 了 对 Bloom 过 滤器 
字 节 对 应 的 索引 数量 较 
无 势 会 缩小 ， 滤 波 器 数量 
曾 大 。 图 9 中 给 出 了 这 三 种 算法 


不 境 下 的 性 能 对 比 结果 。 


消耗 的 存储 空间 (hs) 
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图 9 用 生成 的 路 由 表 测 试 的 查找 性 能 比较 结 
从 图 中 可 以 看 到 ， 随 着 表 项 的 增加 ， 算 法 的 查找 速度 一 直 
趋 于 稳定 ， 并 且 保 持 在 较 高 的 性 能 上 。 这 是 由 于 BTBF 算法 对 


前 缀 进行 了 B- 树 和 前 组 长 度 
量 的 巨大 变化 ，Bloom 过 滤器 的 查找 集合 一 直 保 持 在 稳定 的 大 


的 分 类 , 这 两 种 方式 都 能 适应 数据 


征 


找 
实 


聚 


[9] 


Bloom 过 滤器 的 BTBF 算法 。 


ChinaXiv 合 作 期 有 
姚明， 等 : 一 种 B- 树 和 Bloomfilter 相 结合 的 IPv6 路 由 查找 算法 


结束 语 


分 析 了 IPv6 地 址 结构 ， 分 配 策略 和 IPv6 骨 了 
， 将 B- 树 和 Bloom 过 滤器 相 结合 ， 提 出 了 一 种 基于 B- 树 和 
与 已 有 算法 相 比 ，BTBF 算法 查 
速度 快 , 占用 内 存 小 , 有 较 好 的 扩展 性 , 并 且 支 持 增 量 更 新 。 
验 结果 表明 ，BTBF 算法 在 保持 优良 的 查找 性 能 外 还 能 适应 
表 大 小 的 改变 ， 始 终 保持 稳定 状态 。 这 得 益 于 对 B- 树 查找 


n 


路 由 表 的 特 


lk 度 低 这 一 优良 特点 的 充分 利用 ， 促 使 整个 算法 的 正确 性 和 可 


性 ， 实 验 结果 也 验证 了 该 方法 的 有 效 性 。 
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